实习派 | 李范红:从医学到计算机, MSRA 赋予我的无限可能
“我应该是目前在 MSRA 的唯一一个医学背景的实习生”,采访刚开始,李范红笑着说,“我这个人,有很多不遵循常规的地方,一篇文章恐怕写不完。”
确实,她的人生从来不中规中矩。原因嘛,用她的话说可能就是 “喜欢尝试,而且从来不怕失败”。
李范红在微软亚洲研究院主持学术写作讲座
从医学到计算机
采访过程中,如果不是听她亲口说起,我可能很难相信永远是自信满满、朗声作答的李范红,也曾经因为遭遇科研不顺的困境而迷茫焦虑,甚至因此休学 Gap 过一年。
这个就读于北京大学医学部的女孩,最初选择基础医学作为志愿时,自然是饱含着对医学的热爱和信心的,她相信人类应当有活得更长、活得更好的权利,并且这一天很快会到来。怀有美好的愿景也要面对现实,生物医学科研的日常实验是琐碎、重复的,具有漫长的实验周期和不可预知的大量影响因素,这样的过程对李范红来说,是“没有正反馈”的,甚至带来了巨大的压力。
这种压力暂时打倒了李范红,但也促使她进行了深入的思考:她要实现自己的理想,但也要选择一种自己喜欢的方式。2016 年是她的 Gap Year,在这一年里,她想回答两个问题:第一,我到底喜欢做什么,擅长做什么? 第二,有没有更好的方法,帮助提高医学科研的效率?
当然,在这一年里,喜欢挑战的她选择去尝试了不一样的东西。
那时,恰逢法国亿万富豪 Xavier Niel 在美国开设独树一帜的免费编程学校 42 University 的硅谷分校。(42 是《银河系漫游指南》里“生命、宇宙,以及任何事情的终极答案”,这所编程学校以以“免学费”和“开放无规则”为两大标签)能在硅谷免费学写代码,通过线上测试之后,她就背起包“说走就走”了一回。
从对编程一无所知,到在项目中经历了 4 周每天写代码 15 小时的生活,她才感受到计算机的魅力,“通过程序和机器沟通是一件很有意思的事情,它极大地提高了人的生产力,而且能得到即时的正反馈,可以说是现实世界最接近‘魔法师’的工作”。也是这之后,李范红逐渐了解到 MSRA 在所有中国计算机专业的学生和程序员中是一个圣地一样的存在。
更让她没想到的是,有一天在北大 BBS 上看到了 MSRA 招收医学背景实习生的消息,“这正是我想做的!”,通过老师推荐和面试,李范红加入了 MSRA 的大家庭。
入职那天,她发了一条朋友圈 “这大概也可以算是一件【想都不敢想然而却成真了的事】吧”。
李范红的朋友圈
和产业更接近
李范红在 MSRA 首先参与的是心脑血管相关疾病的问答系统,她的主要工作包括构建药物和疾病的知识库、判断扩展词关系等,这个系统的目的是自动回答病人在用药方面的问题。在这个项目中,她体会到在微软研究院做科研和与在校科研的巨大区别。
“我理解的MSRA是一个在研究(research)界里最接近产业(industry)的,而在产业界中又最注重研究的。”她这样概括道,“虽然我们希望在科研上能够解决新的问题,能够去做出新的创造性的价值,但同时我们也希望去解决现实性的问题,使技术真正得到应用。”
对与我们合作的公司或者部门来说,他们需要真正地面对病人并帮他们解决问题,因此如何通过真实的需求来调整系统实现就显得尤为重要。
“举一个简单的例子,在标注文本数据时要区分两个词汇是不是同义词。对病人来说,他可能分不清脑梗死、脑中风、脑出血、脑缺血,但在医学上,这四个概念并非完全相同,实际有着细微的差别。这时我们要考虑到面对的是真实的病人,所以构建知识图谱时不仅要在医学上合乎逻辑,也要从病人的角度考虑。”
在之前 Gap 的一年里,为了解医疗技术真实落地的情况,李范红还在一家研究型 VC 峰瑞资本做过投资分析师实习,在对医疗项目进行行业研究、尽职调查、创始人面谈时,她认识到资本在医疗创业领域的布局时,最重视的还是一个团队的核心技术。所以她希望自己未来能够做一个既懂行业,又懂技术的人。而正是在MSRA,她获得了和产业更接近的独特科研经历。
李范红和微软亚洲研究院的小伙伴们
从北大医学部到清华自动化系
所有 MSRA 的实习生都会常常收到大量举办讲座的邮件,从来不会讲座不够听,只会恨自己时间不够多。受邀来 MSRA 讲 talk 的嘉宾,常有是学界和业界的重量级人物。采访时李范红就兴奋地说她曾经成功获得和微软执行副总裁沈向洋博士以及 CMU CS Dean Andrew Moore 的自拍。能够和大佬们如此近距离的接触可以说是 MSRA 得天独厚的优势,范红也在其中获益良多,沈向洋博士建议她(以及各个领域的学生们)积极地掌握编程、运用机器学习的能力,而 Andrew Moore 则推荐她关注 CMU 的 medical robotics 项目。
就在采访前不久,李范红刚刚得到了清华大学推免保研预录取的消息,而这当然也要归功于她在 MSRA 的经历。今年6月,清华大学马少平教授来 MSRA 分享 “那些年,我们做过的AI”,当时坐在第一排的李范红深受鼓舞,当天她就写邮件给马老师请教自己是否有可能从医学背景转向计算机相关专业研究生,以及如何成为像他一样的AI研究者。马少平教授很快就给她了回复,并向她推荐了自动化系生物信息学研究部张学工老师以及医学院一位研究脑信号的老师。目前,李范红已经收到了生物信息学部的预录取,即将加入张学工老师的团队。张学工老师是 “陈-扎克伯格基金会”(Chan Zuckerberg Initiative)近期公布的“人类细胞图谱计划” (the Human Cell Atlas)首批资助的 38 个项目中唯一入选的由中国科学家承担的项目。对即将参与到如此宏大而前沿的项目之中,李范红也充满期待。
从医学到计算机,任何人看来这都是不小的跨度。“能够得到老师的认可,要十分感谢 MSRA 的实习经历。无论是从智慧医疗角度、还是从机器学习角度来看,我所参与的研究项目都是非常前沿的,在 MSRA 的学习的前沿知识给我的人生带来了新的可能。”
李范红与微软全球执行副总裁沈向洋自拍
关于 MSRA 的独家记忆
每个 MSRA 的实习生都会有属于自己的独特回忆,可能是凌晨四点二号楼的灯光,可能是吹着空调冷风调参数,而李范红的回忆则都与“团队”相关。
她首先要感谢的人,是网络搜索和数据挖掘组的主管闫峻博士,他是李范红的 mentor,他不仅充分支持李范红尝试各种她感兴趣的研究,而且教会了她 mentorship 的另一重含义。她近期在做医生问诊的对话路径挖掘的项目,在一次讨论中,他们组一起写了一白板的思路。李范红指着其中一个关键步骤问“这一步要怎么做呢?”。闫峻说:“这就是你要解的问题呀”,这句话让李范红意识到,“虽然我们常常把 mentor 当作我们的老师,但 mentor 们不单纯是指导我们工作,而是和我们一起做问题的发现者和探索者。”
在采访中,李范红还不止一次提到她的另一位 mentor 纪蕾。她不仅耐心指导范红、鼓励她进行各种有意义的尝试,还和范红一起通力合作,推动项目进展,可以说是亦师亦友。她们在进行 CCKS 会议的数据标注任务时,曾反复修改 22 版标注规则,和标注团队反复沟通到深夜。她们都热爱运动,也常一起在健身房挥洒汗水。李范红提到她在主持 MSRA Family Fest 时组织大家玩亲子平板支撑,她的 mentor 纪蕾姐也是坚持到最后的选手之一,这让范红感到特别骄傲。
接着,她又高兴地说要感谢她们组的其他实习生们。平时大家一起聊天,一起打桌游,遇到不会的就向同学们请教,使她拥有了一段“没有困难”的实习经历。
李范红和桌游社的小伙伴一起玩狼人杀
“我暑期参加了一个机器学习相关的暑期学校,因为数学/计算机背景不足,当时做 assignment 的时候有些困难,我们组同学就在微信上远程支援我。前段时间准备保研面试,还有中山大学联培的同学给我‘一小时精讲数据结构’,同学们还帮我模拟面试等等。”
说着说着,她又大笑道:“我们还经常互相提醒要去抢水果吃”。她谈起了 MSRA 的下午茶水果鄙视链:“站在顶端的是一分钟就能被抢光的水蜜桃,然后下面是西瓜哈密瓜各种瓜,遥远的底端是难分伯仲的香蕉和苹果。”话音未落,瞄了一眼手机的她突然站起来,“三点了,我去看一眼!”原来三点是茶水间供应水果的时间。除了水果,MSRA 的饮料和零食也非常丰盛,因而坊间总有“来了胖十斤”的传说。
采访临近结束,李范红说:“我这是我第一个大公司的实习经历,等我实习结束后,我要好好写篇文章讲讲这里。”最后,她俏皮地说:“沈向洋博士说过,能到MSRA实习的同学们以后在人生中一定会获得成功的。‘For people like you and me,success is guaranteed’,大家都会前程似锦!加油!”